Computer Vision

「Computer Vision」タグの記事(8件)

Part 2: Nano Banana Virtual Try-On — 16テストケースの実験記録 連載

Part 2: Nano Banana Virtual Try-On — 16テストケースの実験記録

Geminiの画像生成を仮想試着に適用し、3フェーズにわたって体系的に検証。ノイズ入り画像、クリーン画像、高解像度アクションポーズ——導き出された結論は、前処理パイプラインより解像度が品質を決定するということだった。

読む →
Part 1: GANから生成AIへ — 移行の理由と方法 連載

Part 1: GANから生成AIへ — 移行の理由と方法

Googleが生成AIで仮想試着を実現した。ならば自分のシステムでも試せるのではないか。PASTA-GAN++からGeminiとVertex AIへ——マルチステージGPUパイプラインを1回のAPI呼び出しに集約するまでの記録。

読む →
Part 3: 3エンジン対決 — PASTA-GAN++ vs Nano Banana vs Vertex AI VTO 連載

Part 3: 3エンジン対決 — PASTA-GAN++ vs Nano Banana vs Vertex AI VTO

3世代の仮想試着技術を12テストケースで直接比較。結果が示したのは漸進的な改善ではなく、世代的な飛躍だった。特にGANが根本的に失敗していた体型多様性の領域で、その差は決定的だった。

読む →
第1回:プリクラからバーチャル試着へ — 20年越しの構想 連載

第1回:プリクラからバーチャル試着へ — 20年越しの構想

META FITの原点:服を買う前に自分の姿で試着できるという20年来のビジョンが、キオスク端末からGANベースのバーチャル試着へと進化した経緯と、15以上のVTONモデルの調査結果を紹介します。

読む →
第3回:PF-AFNの実装 — 試着エンジンのコードを読む 連載

第3回:PF-AFNの実装 — 試着エンジンのコードを読む

Parser-Free Appearance Flow Networkの実装を詳細に解説。Feature Pyramid Networkによる特徴抽出、CUDA相関カーネル、オプティカルフローによる衣服ワーピング、ResUnetジェネレータによるコンポジット生成までの全パイプラインを紐解きます。

読む →
第2回:GANを理解する — バーチャル試着を支えるエンジン 連載

第2回:GANを理解する — バーチャル試着を支えるエンジン

敵対的生成ネットワーク(GAN)の仕組みを徹底解説:GeneratorとDiscriminatorの対立構造、GANが拡散モデル以前に画像生成を支配した理由、そしてバーチャル試着システムへの応用まで。

読む →
第4回:姿勢推定・自動採寸・3D再構成 連載

第4回:姿勢推定・自動採寸・3D再構成

OpenPoseによる骨格検出、Graphonomyによる人体パーシング、独自の自動採寸アルゴリズムが仮想試着をどう支えるか。PiFuを用いた2D→3D再構成の探索と、TensorFlow.jsによるWebプロトタイプも解説します。

読む →
第5回:成果・課題・次世代画像生成への道 連載

第5回:成果・課題・次世代画像生成への道

GANベース仮想試着システムの成果と限界を検証。衣服デザインの変質、体型多様性の課題、スマートフォンアプリUI設計、そして拡散モデルが切り拓く次世代META FITの展望を語ります。

読む →